package study_Jsoup;

import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.junit.Test;

import java.io.File;
import java.net.URL;

public class jsoup解析URL {

    @Test
    public void testUrl() throws Exception{
        //解析URL地址,第一个参数是访问的URL，第二个参数是访问时候的超时时间
        Document document = Jsoup.parse(new URL("https://www.bilibili.com/"),5000);

        //使用标签选择器，获取title标签中的内容
        String title = document.getElementsByTag("title").first().text();

        //打印
        System.out.println(title);
    }

    @Test
    public void testString() throws Exception{
        //使用工具类读取文件，获取字符串
        String content = FileUtils.readFileToString(new File(""),"utf8");
        //解析字符串
        Document document = Jsoup.parse(content);
        String title = document.getElementsByTag("title").first().text();
        System.out.println(title);
    }

    @Test
    public void testFile() throws Exception{
        //解析文件
        Document document = Jsoup.parse(new File(""),"utf8");
        String title = document.getElementsByTag("title").first().text();
        System.out.println(title);
    }
}
